Sélection de variables en apprentissage d'ordonnancement. Évaluation des SVM pondérés

نویسندگان

  • Léa Laporte
  • Sébastien Déjean
  • Josiane Mothe
چکیده

RÉSUMÉ. Sélectionner les caractéristiques les plus utiles et les moins redondantes au sein des fonctions d’ordonnancement et réduire les temps d’exécution sont des enjeux en apprentissage d’ordonnancement. Les algorithmes de sélection de variables basés sur les SVM régularisés sont des approches prometteuses dans ce cadre. Dans cet article, nous proposons de nouvelles méthodes de sélection de variables en apprentissage d’ordonnancement basées sur des approches de pondération des SVM en norme `2. Nous proposons une adaptation d’une méthode `2-AROM qui résout des SVM en norme `0 et un algorithme de pondération de la norme `2 qui résout les problèmes en norme `0 et `1. Nos évaluations sur des jeux de données industriels et de référence montrent que les méthodes proposées sont jusqu’à 7 fois plus rapides et 10 fois plus parcimonieuses que l’état de l’art, pour des qualités d’ordonnancement équivalentes.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Séparateurs à Vaste Marge pondérés en norme L2 pour la sélection de variables en apprentissage d'ordonnancement

Learning to rank algorithms are dealing with a very large amount of features to automatically learn ranking functions, which leads to an increase of both the computational cost and the number of noisy redundant features. Feature selection is seen as a promising way to address these issues. In this paper, we propose new feature selection algorithms for learning to rank based on reweighted `2 SVM...

متن کامل

Sélection topologique de variables dans un contexte de discrimination

Résumé. En apprentissage automatique, la présence d’un grand nombre de variables explicatives conduit à une plus grande complexité des algorithmes et à une forte dégradation des performances des modèles de prédiction. Pour cela, une sélection d’un sous-ensemble optimal discriminant de ces variables s’avère nécessaire. Dans cet article, une approche topologique est proposée pour la sélection de ...

متن کامل

Apprentissage de fonctions d'ordonnancement par classification de paires ordonnées et pondérées (OWPC)

RÉSUMÉ. Apprendre les fonctions d’ordonnancement pour les moteurs de recherche est une tâche difficile parce que les critères d’évaluations généralement utilisés sont difficilement optimisables directement. Dans ce cas, nous sommes contraints d’optimiser une fonction d’erreur d’ordonnancement qui en est proche. Dans ce papier, nous proposons de définir une fonction d’erreur d’ordonnancement en ...

متن کامل

Méthodologie de sélection de caractéristiques pour la classification d'images satellitaires

Résumé : Choisir les descripteurs d’une image en vue de son indexation n’est pas aisé, du fait de la variété des choix présentés dans la littérature. Nous développons à cet effet une méthodologie permettant de comparer différents ensembles de caractéristiques extraits d’une même base d’images. Cette méthodologie repose sur des algorithmes supervisés et non supervisés de sélection de caractérist...

متن کامل

Une approche filtre pour la sélection de variables en apprentissage non supervisé

Résumé. La Sélection de Variable (SV) constitue une technique efficace pour réduire la dimension des espaces d’apprentissage et s’avère être une méthode essentielle pour le pré-traitement de données afin de supprimer les variables bruitées et/ou inutiles. Peu de méthodes de SV ont été proposées dans le cadre de l’apprentissage non supervisé, et, la plupart d’entre elles, sont des méthodes dites...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Document Numérique

دوره 18  شماره 

صفحات  -

تاریخ انتشار 2015